當我們在眾多資料中,想挑出各年度中的佼佼者時可使用此方法。
匯入資料
電影名稱 年份 分數
0 A電影 2019 54
1 B電影 2018 90
2 C電影 2018 58
3 D電影 2022 53
4 E電影 2019 66
5 F電影 2021 82
6 G電影 2023 85
7 H電影 2020 75
8 I電影 2023 56
9 J電影 2020 55
10 K電影 2018 48
目標:從資料中挑選出年度精選電影
使用sort_values(),將上述資料以年份從大到小排序。
movie.sort_values('年份',ascending=False)
執行結果:
電影名稱 年份 分數
6 G電影 2023 85
8 I電影 2023 56
3 D電影 2022 53
5 F電影 2021 82
7 H電影 2020 75
9 J電影 2020 55
0 A電影 2019 54
4 E電影 2019 66
1 B電影 2018 90
2 C電影 2018 58
10 K電影 2018 48
在sort_values()中加入另一個欄位名稱,會將上述資料以年份從大到小排序。
會先根據年份欄位從大到小排序,若遇相同年份者,則會依分數欄位從大到小進行排序。
movie.sort_values(['年份','分數'],ascending=False)
執行結果:
電影名稱 年份 分數
6 G電影 2023 85
8 I電影 2023 56
3 D電影 2022 53
5 F電影 2021 82
7 H電影 2020 75
9 J電影 2020 55
4 E電影 2019 66
0 A電影 2019 54
1 B電影 2018 90
2 C電影 2018 58
10 K電影 2018 48
使用drop_duplicates(),刪除年份欄位重覆出現的資料,只會保留第一筆資料。
movie.sort_values(['年份','分數'],ascending=False).drop_duplicates(subset='年份')
執行結果:
電影名稱 年份 分數
6 G電影 2023 85
3 D電影 2022 53
5 F電影 2021 82
7 H電影 2020 75
4 E電影 2019 66
1 B電影 2018 90
傳回後即為每個年度評分最高的電影排行榜就出爐囉~